NVIDIA MPS
-
单GPU多MPI跑GROMACS:如何通过NVIDIA MPS优化性能并彻底避免显存溢出
在利用高性能计算(HPC)集群运行分子动力学模拟时,GROMACS 凭借其对 GPU 的高效支持成为了行业标配。然而,在实际生产环境中,我们经常会遇到这样的尴尬场景: 当模拟的体系较小(如少于 10 万原子),或者 CPU 核心数较...
-
多卡多NUMA服务器性能调优:MPI进程、GPU与MPS守护进程的最优绑定实践
在多卡多NUMA(Non-Uniform Memory Access)架构的服务器上运行MPI(Message Passing Interface)大规模并行程序时,默认的调度策略往往会导致灾难性的性能抖动。 如果一个MPI进程运行在...